AI024
ROCm dan HIP: Tutorial Lengkap 10 Bab
Rekayasa Kinerja pada GPU AMD
Tujuan Pembelajaran
- Mengidentifikasi hambatan arsitektur menggunakan Omniperf dan ROCProfiler.
- Mengoptimalkan pola akses memori untuk memaksimalkan throughput HBM2e/HBM3.
- Memahami penjadwalan wavefront dan penggunaan pada Unit Komputasi CDNA.
- Menerapkan optimasi tingkat instruksi untuk inti vektor dan matriks.